Calculamos a média IMDB de cada série fazendo uma média das notas, dadas pelos espectadores, de cada episódio. Essa nota, por sua vez, é calculada fazendo-se uma média ponderada das notas, variando de 1 a 10, e a quantidade de pessoas que votaram. Portanto, podemos suspeitar que nossa média IMDB é representativa, ou seja, a nota da maioria das pessoas está em torno dessa média. Dito isto, temos que, dentre as séries escolhidas, a maior nota é a de Sherlock, aproximadamente 8.9, porém as outras não não estão muito longe disso.
A escrita na parte inicial do texto ficou um pouco difícil de compreender, principalmente com relação a explicação sobre o que foi calculado no início do texto e o significado disso. Isso afetou o entendimento sobre a representatividade da variável “média IMDB”, bem como o motivo por escolher a média ao invés de outra medida de centralidade, como mediana, para caracterizar as avaliaçãoes de cada série.
medias_series = plot_ly(medias_imd_por_serie,
x = ~series_name,
y = ~media_imdb,
name = "Média IMDB Séries",
type = "bar",
color = ~series_name) %>%
layout(yaxis = list(title = "Média IMDB"),
xaxis = list(title = "Séries"),
barmode = "group")
medias_series
No entanto, podemos ver que The Killing é a que possui uma distribuição de notas mais homogênea, as pessoas votaram de forma mais parecida, enquanto que a dispersão das notas dos episódios de Mad Men e Sherlock são maiores, tendo uma maior diferença entre os votos de cada pessoa. Sendo Mad Men a que tem uma maior distância entre a menor e maior nota atribuida. Além disso, podemos perceber que a mediana e a média de cada série estão próximas uma da outra, confirmando que a média representa bem o que as pessoas acham dessas três séries.
Para enriquecer seu raciocínio, poderia ser feita uma explicação sobre a melhor maneira para ler os gráficos. Por exemplo: de que modo ou como poderiamos ver que uma série possui uma distribuição de notas mais homogênea do que outra série? Além disso, poderia haver uma indicação no texto sobre qual dos gráficos você está falando naquele momento, pq em alguns momentos fiquei confuso nesse sentido.
variacoes_notas = plot_ly(series_a_serem_analisadas,
x = ~series_name,
y = ~user_rating,
type = "box",
color = ~series_name) %>%
layout(yaxis = list(title = "Média IMDB"),
xaxis = list(title = "Série"))
variacoes_notas
No gráfico abaixo, podemos observar dois casos interessantes. O público parece não ter gostado muito da última temporada de Sherlock, pois a avaliação da quarta temporada caiu 0.625 em relação a terceira, e é a nota mais baixa atribuída à série. Já The Killing, por mais estranho que pareça, principalmente para quem viu a nota da série no Rotten Tomatoes, parece agradar cada vez mais ao público, mostrando um gráfico sempre crescente. Com relação a Mad Men, as notas não variam muito sempre maior que 8 e menor que 9. Contudo, vemos que a quinta e sexta temporada não são as favoritas.
media_por_temporada = aggregate(series_a_serem_analisadas$user_rating,
by = list(series_name = series_a_serem_analisadas$series_name,
season = series_a_serem_analisadas$season),
mean)
colnames(media_por_temporada)[3] <- "season_mean"
media_temporada = plot_ly(media_por_temporada,
x = ~season,
y = ~season_mean,
color = ~series_name,
type = "scatter",
mode = "lines") %>%
layout(yaxis = list(title = "IMDB da Temporada"),
xaxis = list(title = "Temporada"))
media_temporada
O texto poderia ser mais explícito sobre qual das duas medidas (média e mediana) discutidas anteriormente estava sendo utilizada nessa seção para explicar as avaliações, pensando no ponto de vista de um leitor que não curse a disciplina.
Essa parte não foi feita, mas fica a sugestão para a utilização de medidas de dispersão como IQR ou desvio padrão, que poderiam ajudar sua explicação e a construção de visualizações que contribuam com o seu raciocínio para responder a pergunta.
Comentários
O relatório está muito bom, principalmente no que diz respeito aos gráficos. O ponto de melhora pode ser com relação a explicação textual, de modo que seu texto reflita melhor seu raciocínio, como a indicação do que representa cada gráfico, qual gráfico está sendo ou será abordado pelo texto em dado momento - isso facilita muito a leitura de leigos no assunto. E também sugiro a utilzação de um panorama descrevendo os dados que serão tema da análise, como forma de introduzir ao leitor o que será abordado ao longo do texto.